iT邦幫忙

2023 iThome 鐵人賽

DAY 8
2
AI & Data

初次抓舉AI的世界系列 第 8

半監督式演算法 D1 - Label Propagation algorithm(LPA)

  • 分享至 

  • xImage
  •  

在做深度學習的時候,通常會採用自監督式學習的方式去做,也就是會使用 pre-train 的模型來提升效能。舉例來說,在進行影像的分類與分割任務時,最常見的是使用 ImageNet。然而,就有人開始思考,如果不使用不同分布的數據進行預訓練,而是改用半監督式學習的方式,對未標記的數據進行訓練,是否會有更好的效果呢?

因此,今天要來介紹一種半監督學習的演算法,用來對未標記的數據分配標籤!


Label Propagation algorithm (LPA)

是一種基於圖的半監督式演算法,這個演算法的核心思想是:相似的資料點應該具有相同的標籤

它的運作方式是讓模型根據已知的資訊(標籤)自動學習,並將這些知識擴散到相似的資料點,讓相似的資料點具有相似的標籤。具體而言,它通過產生一個帶有權重邊的圖(Graph),將所有資料點相互連接起來,然後在相鄰的資料點之間傳播標籤。換句話說,資料點之間的相似性和連接性是關鍵因素。如果兩個資料點在空間中靠近,或者它們之間有較強的連接,那麼它們更有可能具有相同的標籤。這個演算法會逐漸將標籤傳播擴散給相似的資料點,直到達到穩定狀態。

LPA 的優點是無需事先知道有多少個標籤,它可以自動適應資料的特性,比較適合數據集具有一定聚類結構或者是相似性結構的情況

步驟

https://ithelp.ithome.com.tw/upload/images/20230923/20155915iTfhAkyfJ5.png

  1. 建立 Graph 表示數據集
    先將每個數據點表示為 Graph 中的一個節點(Node),如果兩個數據點之間具有相關性或相似性,則在它們之間建立一條邊(Edge)
    這些 Edge 可以是基於特徵的相似性或是其他相關性指標
  2. 初始化標籤
  3. 標籤傳播
    在每一次迭代,對於每個未標記的節點,根據其相鄰節點的已知標籤以某種方式來調整它的標籤。最簡單的調整方法是基於鄰近節點的標籤的權重加權平均
  4. 重複標籤傳播,直到達到收斂條件
    收斂條件可以是迭代次數達到一定限制或標籤變化不大
  5. 獲得最終標籤
    在收斂後,未標記節點上的標籤即可視為預測的結果

參考

Self-training當道:對比Pre-training的優缺點


上一篇
模型學習方式 D6 - 自監督式學習
下一篇
半監督式演算法 D2 - Self-training 與 Co-training
系列文
初次抓舉AI的世界30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言